Hochschule Furtwangen
Institute of Precision Medicine
E-Mail: kohl@hs-furtwangen.deNicht nur in Italien (Rizzello 2020), sondern weltweit führen wir aktuell einen Krieg gegen COVID-19. Völlig unklar ist noch, wie viele Todesopfer dieser Krieg fordern wird. Auf Basis aktuell vorliegender Zahlen aus Deutschland, China und Korea und mit Hilfe einfacher statistischer Mittel wird im Folgenden die erwartete Anzahl von COVID-19 Toten in Deutschland berechnet. Außerdem wird eine Schätzung für die Dunkelziffer ermittelt. Die Berechnungen und graphischen Darstellungen wurden mit der Statistiksoftware R (R Core Team 2020) und den Erweiterungspaketen MKinfer (Kohl 2019), ggplot2 (Wickham 2016), ggsci (Xiao 2018) und plotly (Sievert 2018) durchgeführt. Das Dokument wurde unter Verwendung von knitr (Xie 2015) und R Markdown (Xie, Allaire, and Grolemund 2018) erstellt und findet sich unter https://github.com/stamats/COVID-19.
Laut dem Statistischen Bundesamt leben aktuell etwas mehr als 83 Mio. Menschen in Deutschland. Für unsere Berechnungen verwenden wir die prognostizierten Zahlen des Statistischen Bundesamtes für 2019 (Simulationsvariante 1) und gehen folglich von einer Bevölkerungszahl von 83,2 Mio. Menschen aus (DESTATIS: Statistisches Bundesamt 2020a).
Die Abbildung 1 zeigt, wie sich die Bevölkerung von Deutschland 2019 auf verschiedene Altersgruppen verteilte.
Bevölkerung in Deutschland 2019 aufgeteilt in Altersgruppen.
Wir werden statistische Ungenauigkeiten bei den Bevölkerungszahlen in den folgenden Berechnungen nicht berücksichtigen.
Die altersabhängigen Letalitäten – d.h., die Anteile der Verstorbenen unter allen Erkankten – in China vom 01.01.2020 bis zum 11.02.2020 sind in Abbildung 2 dargstellt (Verity et al. 2020, Table 1; Wu and McGoogan 2020). In der Arbeit von Verity et al. (2020) wurde zur Berücksichtigung der statistischen Unsicherheit bei den beobachteten Letalitäten unter anderem das 95%-Konfidenzintervall (95%-KI) von Clopper-Pearson (Clopper and Pearson 1934) herangezogen. Zur einfacheren Vergleichbarkeit werden wir ebenfalls dieses Konfidenzintervall verwenden, um die statistische Unsicherheit bei den Letalitäten auszudrücken. Wir müssen davon ausgehen, dass es sich hierbei um eine konservative Betrachtung handelt. Die sogenannte Überdeckungswahrscheinlichkeit dieses Intervals ist gerade bei kleinen Wahrscheinlichkeiten größer als 95%; d.h., das Interval ist etwas zu lang (Brown, Cai, and DasGupta 2001).
Beobachtete Letalitäten in China vom 01.01.2020 bis zum 11.02.2020 (inkl. 95%-KI).
Lässt man das Alter außer Acht, so ergibt sich eine kumulierte Letalität von 2,29 % (95%-KI: 2,15 - 2,43 %). Dies liegt etwas über der Einschätzung des Robert-Koch-Instituts, welches von einer Letalität von 1-2 % ausgeht (Wikipedia 2020). Diese Zahlen liegen auch einer aktuellen Simulationsstudie zur Reduktion von Sozialkontakten und deren Auswirkung auf die Pandemie sowie die Herdenimunität für Polen und Deutschland zu Grunde (Bock et al. 2020, Table 1), auf deren Ergebnisse wir später noch etwas eingehen werden.
Neben den beobachteten Letalitäten finden sich in der Arbeit von Verify et al. (2020) auch adjustierte Letalitäten. Hier wurden Anpassungen an die Demographie und die Dunkelziffer vorgenommen. Es sind hierbei auch sogenannte Bayes’sche 95% Glaubwürdigkeitsintervalle (95%-BGI) angegeben (Verity et al. 2020, Table 1).
Adjustierte Letalitäten in China vom 01.01.2020 bis zum 11.02.2020 (inkl. 95%-BGI).
Lässt man das Alter außer Acht, so ergibt sich eine adjustierte kumulierte Letalität von 1,38 % (95%-BGI: 1,23 - 1,53 %). Dies passt sehr gut zur Einschätzung des Robert-Koch-Instituts, welches von einer Letalität von 1-2 % ausgeht (Wikipedia 2020).
Die altersabhängigen Letalitäten in Korea bis zum 20.03.2020 sind unten dargestellt (Shim et al. 2020, Table 2). In der Arbeit von Shim et al. (2020) sind keine Konfidenzintervalle angegeben. Wir berechnen und verwenden wieder 95%-Konfidenzintervall (95%-KI) von Clopper-Pearson (Clopper and Pearson 1934).
Beobachtete Letalitäten in Korea bis zum 20.03.2020 (inkl. 95%-KI).
Lässt man das Alter außer Acht, so ergibt sich eine kumulierte Letalität von 1,09 % (95%-KI: 0,88 - 1,33 %). Dies liegt noch im Rahmen der Einschätzung des Robert-Koch-Instituts, welches von einer Letalität von 1-2 % ausgeht (Wikipedia 2020).
Wir berechnen die Anzahl der zu erwartenden Toten auf Basis der aktuellen Bevölkerungszahlen, der beobachteten altersabhängigen Letalitäten aus China und der Annahme einer altersunabhängigen Durchseuchung zwischen 15 % und 85 %. Die Berechnung basiert auf folgender einfacher Formel \[ \text{Erwartete Anzahl Tote} = N_{\text{Altersgruppe}} \times D \times L_{\text{Altersgruppe}} \] Hiebei steht \(N_{\text{Altersgruppe}}\) für die Anzahl der Personen in der jeweiligen Altersgruppe, \(L_{\text{Altersgruppe}}\) für die Letalität in dieser Altersgruppe und \(D\) für die altersunabhängige Durchseuchungsrate. Folglich entspricht \(N_{\text{Altersgruppe}}\times D\) der erwarteten Anzahl von Erkrankten in der jeweiligen Altersgruppe und \(N_{\text{Altersgruppe}}\times L_{\text{Altersgruppe}}\) der erwarteten Anzahl von Toten in der jeweiligen Altersgruppe bei einer Durchseuchung von 100%. Wir verwenden neben den beobachteten Letalitäten auch die unteren und oberen Grenzen der 95%-Konfidenzintervalle und berechnen hieraus sogenannte (punktweise) 95%-Konfidenzbänder.
Erwartete Anzahl von Toten in Deutschland in Abhängigkeit von der Durchseuchung (inkl. 95%-Konfidenzbänder).
Wir sehen anhand des sehr breiten Konfidenzbandes, dass gerade für junge Menschen bis zu einem Alter von 20 Jahren die Vorhersage der erwarteten Anzahl von Toten noch recht schwierig ist. Dies liegt daran, dass für diese Altersgruppe die Letalitätsschätzung noch recht ungenau ist.
Gehen wir davon aus, dass ohne entsprechend strikte Maßnahmen eine Durchseuchung von 60-70% nötig sein wird, um die Pandemie zu stoppen, so ergibt unsere obige Berechnung, dass wir mit ca. 1,26-1,47 Millionen Toten in Deutschland rechnen müssen (Drosten 2020). Zum Vergleich: in Deutschland starben 2018 und 2019 jeweils ca. 950.000 Menschen (DESTATIS: Statistisches Bundesamt 2020b). Gelänge es hingegen durch strikte Maßnahmen eine Durchseuchung von nur 15% oder weniger zu erreichen, was laut einer aktuellen Simulationsstudie durch eine sehr starke Reduktion der Sozialkontakte möglich sein könnte, so könnte dies alleine in Deutschland ca. 1 Million Menschenleben retten (Bock et al. 2020).
Wir wiederholen die obigen Berechnungen mit den adjustierten Letalitäten aus China, wobei wir dieses Mal anstelle der 95%-Konfidenzbänder sogenannte (punktweise) 95%-Glaubwürdigkeitsbänder berechnen.
Erwartete Anzahl von Toten in Deutschland in Abhängigkeit von der Durchseuchung (inkl. 95%-Glaubwürdigkeitsbänder).
Durch die Adjustierung der Letalitäten ergeben sich gewissen Veränderungen in den Altersgruppern. Die Gesamtzahl der Toten bei einer Durchseuchung von 60-70% verändert sich nur wenig. Die erwartete Anzahl von Toten sinkt um ca. 30.000 auf ca. 1,23-1,44 Millionen Tote in Deutschland. Entsprechend ergibt sich auch bei dieser Berechnung, dass man durch eine geringe Durchseuchung von nur 15% oder weniger alleine in Deutschland ca. 1 Million Menschenleben retten könnte.
Wir wiederholen die obigen Berechnungen mit den beobachtetn Letalitäten aus Korea.
Erwartete Anzahl von Toten in Deutschland in Abhängigkeit von der Durchseuchung (inkl. 95%-Konfidenzbänder).
Die Altersgruppe von 0-20 ist hier nur schwer einzuschätzen, da in Korea bis zum 20.03. kein Todesfall in dieser Altersgruppe beobachtet wurde. Es ist in der Abbildung, welche eine logarithmische Achsenskalierung verwendet, daher nur die obere Grenze des 95%-Konfidenzbandes klar zu sehen.
Legen wir die Zahlen aus Korea zugrunde, so liegt die erwartete Anzahl von Toten bei einer angenommenen Durchseuchung von 60-70% bei ca. 0,76-0,87 Millionen Tote in Deutschland, wobei die statistische Unsicherheit deutlich größer ist als bei den Zahlen aus China. Folglich sind auch deutlich mehr als 1,0 Millionen Tote nicht auszuschließen. Bei einer geringen Durchseuchung von nur 15% oder weniger könnten in Deutschland wohl deutlich mehr als 0,5 Millionen Menschenleben gerettet werden.
Wir vergleichen die Ergebnisse unserer Berechnungen mit den aktuellen Zahlen vom 09.04.2020 (Worldometers.info 2020). Es gab bis zu diesem Datum 113.296 bekannte Fälle von COVID-19 in Deutschland. Davon sind 46.300 bereits wieder gesund und 2.349 verstorben, was 48.649 abgeschlossenen und 64.647 aktiven Fällen entspricht. Kombinieren wir die Zahlen zu den abgeschlossenen Fällen mit den beobachteten Letalitäten aus China und nehmen an, dass die Verteilung der Fälle auf die Altersgruppen der Verteilung der Altersgruppen in der Bevölkerung entspricht, da hierzu keine genauen Zahlen vorliegen, so können wir mit der oben angegebenen Formel die erwartete Anzahl von Toten je Altersgruppe berechnen.
Erwartete Anzahl von Toten pro Altersgruppe in Deutschland zum 09.04.2020 (inkl. 95%-KI).
Demnach sollten sich unter den abgeschlossenen Fällen 1.226 Tote (95%-KI: 1.063 - 1.439) befinden. Ein Grund für den Unterschied zwischen den beobachteten und den berechneten Zahlen könnte neben der nicht genau bekannten Letalität und Verteilung der abgeschlossenen Fälle auf die Alterssgruppen eine entsprechende Dunkelziffer sein. Gehen wir weiter davon aus, dass die Letalitäten von China auch auf Deutschland zutreffen, die Verteilung der abgeschlossenen Fälle auf die Altergruppen der Verteilung der Altersgruppen in der Bevölkerung entspricht und eine altersunabhängige Durchseuchungsrate vorliegt, so können wir aus der aktuellen Anzahl von Toten die tatsächliche aktuelle Durchseuchungsrate berechnen. Es gilt \[ D_\text{aktuell} = \frac{\text{Anzahl Tote aktuell}}{\text{Erwartete Anzahl Tote insgesamt}} \] Die erwartete Anzahl von Toten insgesamt erhält man, indem man die erwartete Anzahl von Toten für jede Altersgruppe bei 100% Durchseuchung summiert; d.h., \[ \text{Erwartete Anzahl Tote insgesamt} = \sum\limits_{\text{Altersgruppen}} N_{\text{Altersgruppe}}\times L_{\text{Altersgruppe}} \]
Dies führt auf eine geschätzte Durchseuchung von ca. 1.121 pro Million (95%-KI: 954 - 1.292 pro Million). Sollte dies zutreffen, so ergeben sich nicht 48.649, sondern bereits 93.226 abgeschlossene COVID-19 Fälle (95%-KI: 79.396 - 107.529) in Deutschland. Dies würde bedeuten, dass bisher ca. die Hälfte (95%-KI: 45,2 - 61,3 %) der COVID-19 Fälle in Deutschland auch entdeckt wurden. Dies deckt sich sehr gut mit der Einschätzung des Robert-Koch-Instituts, welches davon ausgeht, dass etwa die Hälfte der Fälle durch Tests erfasst werden (Wikipedia 2020).
Ein Problem bei der obigen Berechnung des Anteils der entdeckten Fälle ist, dass es keine Meldepflicht für die Genesenen gibt. Entsprechend ist es gut möglich, dass die gemeldete Zahl der Genesenen eine untere Grenze für die tatsächliche Anzahl an Genesenen darstellt. Ist jedoch die Anzahl der Genesenen höher, so erhöht dies den oben berechneten Anteil an entdeckten Fällen; d.h., die Dunkelziffer reduziert sich.
Wir wiederholen die obige Berechnung, wobei wir dieses Mal anstelle der beobachteten die adjustierten Letalitäten aus China verwenden.
Erwartete Anzahl von Toten pro Altersgruppe in Deutschland zum 09.04.2020 (inkl. 95%-BGI).
Demnach sollten sich unter den abgeschlossenen Fällen 1.199 Tote (95%-BGI: 1.014 - 1.424) befinden. Der Unterschied zur verangegangenen Berechnung ist demnach wieder nur gering. Ausgehend von diesen Zahlen berechnen wir wieder die Dunkelziffer.
Dies führt auf eine geschätzte Durchseuchung von ca. 1.145 pro Million (95%-BGI: 965 - 1.354 pro Million). Sollte dies zutreffen, so ergeben sich nicht 48.649, sondern bereits 95.278 abgeschlossene COVID-19 Fälle (95%-BGI: 80.263 - 112.684) in Deutschland. Auch bei dieser Berechnung erhalten wir wieder, dass bisher ca. die Hälfte (95%-BGI: 43,2 - 60,6 %) der COVID-19 Fälle in Deutschland auch entdeckt wurden.
Wir wiederholen die obigen Berechnungen mit den beobachteten Letalitäten aus Korea.
Erwartete Anzahl von Toten pro Altersgruppe in Deutschland zum 09.04.2020 (inkl. 95%-BGI).
Demnach sollten sich unter den abgeschlossenen Fällen 741 Tote (95%-KI: 492 - 1.158) befinden. Ausgehend von diesen Zahlen berechnen wir wieder die Dunkelziffer.
Dies führt auf eine geschätzte Durchseuchung von ca. 1.855 pro Million (95%-KI: 1.186 - 2.793 pro Million). Sollte dies zutreffen, so ergeben sich nicht 48.649, sondern bereits 154.301 abgeschlossene COVID-19 Fälle (95%-KI: 98.698 - 232.352) in Deutschland. Es folgt, dass bisher ca. ein Drittel (95%-KI: 20,9 - 49,3 %) der COVID-19 Fälle in Deutschland auch entdeckt wurden.
Da die genaue Letalität von COVID-19 nicht bekannt ist (Wikipedia 2020), ist die erwartete Anzahl von Toten entsprechend ungewiss. Die obigen Berechnungen legen jedoch nahe, dass durch Maßnahmen, welche die Durchseuchungsrate deutlich reduzieren, alleine in Deutschland hundertausende Menschenleben gerettet werden könnten. Unklar ist jedoch, ob und in welchem Umfang die dafür nötigen strengen Maßnahmen, sei es direkt oder indirekt, ebenfalls Menschenleben kosten könnten.
Darüber hinaus zeigen die Berechnungen, dass in Deutschland bisher zwischen 20 % und 60 % der Fälle auch entdeckt wurden. Wir erwarten eine Dunkelziffer von 2-3. Eine Dunkelziffer von 5 oder mehr, wie von manchen Experten vermutet wird, erscheint auf Basis unserer Berechnungen sehr unwahrscheinlich (Deutschlandradio 2020).
Es werden jedoch nicht nur sehr viele Menschen durch diese Pandemie ihr Leben verlieren, sondern auch sehr viele Menschen Folgeschäden davontragen. Aktuell geht man davon aus, dass das SARS‐CoV‐2 Virus neben Lungenschäden auch Schädigungen des Herz-Kreislauf-Systems und des Gehirns verursacht (Zhang et al. 2020; Madjid et al. 2020; Li, Bai, and Hashikawa 2020). Die Häufigkeit und Stärke solcher Folgeerkrankungen ist im Moment jedoch noch weitgehend unbekannt. Wir können aber totzdem davon ausgehen, dass länger andauerende strikte Maßnahmen nicht nur sehr viele Menschen vor dem Tod bewahren, sondern auch sehr viele vor gesundheitlichen Folgeschäden schützen würden. Je nach Umfang und Stärke dieser Schäden könnten diese eine nicht unerhebliche zukünftige Belastung für das Gesundheitssystem darstellen und einen entsprechenden ökonomischen Folgeschaden bedeuten.
Bock, Wolfgang, Barbara Adamik, Marek Bawiec, Viktor Bezborodov, Marcin Bodych, Jan Pablo Burgard, Thomas Goetz, et al. 2020. “Mitigation and Herd Immunity Strategy for Covid-19 Is Likely to Fail.” medRxiv. Cold Spring Harbor Laboratory Press. https://doi.org/10.1101/2020.03.25.20043109.
Brown, Lawrence D., T. Tony Cai, and Anirban DasGupta. 2001. “Interval Estimation for a Binomial Proportion.” Statistical Science 16 (2). Institute of Mathematical Statistics: 101–17. http://www.jstor.org/stable/2676784.
Clopper, C. J., and E. S. Pearson. 1934. “The Use of Confidence or Fiducial Limits Illustrated in the Case of the Binomial.” Biometrika 26 (4). [Oxford University Press, Biometrika Trust]: 404–13. http://www.jstor.org/stable/2331986.
DESTATIS: Statistisches Bundesamt. 2020a. “14. koordinierte Bevölkerungsvorausberechnung für Deutschland. Variante 1: Moderate Entwicklung bei niedrigem Wanderungssaldo (G2L2W1).” DESTATIS: Statistisches Bundesamt, letzter Zugriff: 05.04.2020. https://service.destatis.de/bevoelkerungspyramide/.
———. 2020b. “Sterbefälle und Lebenserwartung. 2019: Vorläufige Schätzung.” DESTATIS: Statistisches Bundesamt, letzter Zugriff: 05.04.2020. https://www.destatis.de/DE/Themen/Gesellschaft-Umwelt/Bevoelkerung/Sterbefaelle-Lebenserwartung/vorlaeufige-ergebnisse.html.
Deutschlandradio. 2020. “Covid-19. Wie hoch die Dunkelziffer bei den Coronavirus-Infektionen ist.” Deutschlandradio 08.04.2020, letzter Zugriff: 09.04.2020. https://www.deutschlandfunk.de/covid-19-wie-hoch-die-dunkelziffer-bei-den-coronavirus.1939.de.html?drn:news_id=1118663.
Drosten, Christian. 2020. “Chef-Virologe der Charité sicher: 70 Prozent der Deutschen werden Corona bekommen.” Berliner Zeitung 01.03.2020, aktualisiert 01.04.2020, letzter Zugriff: 05.04.2020. https://www.bz-berlin.de/berlin/70-prozent-der-deutschen-werden-corona-bekommen.
Kohl, Matthias. 2019. MKinfer: Inferential Statistics. http://www.stamats.de.
Li, Y. C., W. Z. Bai, and T. Hashikawa. 2020. “The neuroinvasive potential of SARS-CoV2 may play a role in the respiratory failure of COVID-19 patients.” J. Med. Virol., February. https://doi.org/10.1002/jmv.25728.
Madjid, Mohammad, Payam Safavi-Naeini, Scott D. Solomon, and Orly Vardeny. 2020. “Potential Effects of Coronaviruses on the Cardiovascular System: A Review.” JAMA Cardiology, March. https://doi.org/10.1001/jamacardio.2020.1286.
R Core Team. 2020. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing. https://www.R-project.org/.
Rizzello, Claudio. 2020. “Wir führen Krieg gegen einen Feind, der unsere Gewohnheiten ausnutzt. Inverview mit Roberto Burioni.” Zeit Online 11.03.2020, letzter Zugriff: 05.04.2020. https://www.zeit.de/wissen/gesundheit/2020-03/roberto-burioni-italien-virologe-coronavirus.
Shim, Eunha, Kenji Mizumoto, Wongyeong Choi, and Gerardo Chowell. 2020. “Estimating the Risk of Covid-19 Death During the Course of the Outbreak in Korea, February-March, 2020.” medRxiv. Cold Spring Harbor Laboratory Press. https://doi.org/10.1101/2020.03.30.20048264.
Sievert, Carson. 2018. plotly for R. https://plotly-r.com.
Verity, R., L. C. Okell, I. Dorigatti, P. Winskill, C. Whittaker, N. Imai, G. Cuomo-Dannenburg, et al. 2020. “Estimates of the severity of coronavirus disease 2019: a model-based analysis.” Lancet Infect Dis, March. https://doi.org/10.1016/S1473-3099(20)30243-7.
Wickham, Hadley. 2016. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. https://ggplot2.tidyverse.org.
Wikipedia. 2020. “COVID-19-Pandemie.” Wikipedia, Die freie Enzyklopädie, letzter Zugriff: 05.04.2020. https://de.wikipedia.org/wiki/COVID-19-Pandemie.
Worldometers.info. 2020. “COVID-19 Coronavirus Pandemic.” Worldometers.info 09.04.2020, letzter Zugriff: 09.04.2020. https://www.worldometers.info/coronavirus/country/germany/.
Wu, Zunyou, and Jennifer M. McGoogan. 2020. “Characteristics of and Important Lessons From the Coronavirus Disease 2019 (COVID-19) Outbreak in China: Summary of a Report of 72 314 Cases From the Chinese Center for Disease Control and Prevention.” JAMA, February. https://doi.org/10.1001/jama.2020.2648.
Xiao, Nan. 2018. ggsci: Scientific Journal and Sci-Fi Themed Color Palettes for ’ggplot2’. https://CRAN.R-project.org/package=ggsci.
Xie, Yihui. 2015. Dynamic Documents with R and Knitr. 2nd ed. Boca Raton, Florida: Chapman; Hall/CRC. https://yihui.org/knitr/.
Xie, Yihui, J.J. Allaire, and Garrett Grolemund. 2018. R Markdown: The Definitive Guide. Boca Raton, Florida: Chapman; Hall/CRC. https://bookdown.org/yihui/rmarkdown.
Zhang, P., J. Li, H. Liu, N. Han, J. Ju, Y. Kou, L. Chen, et al. 2020. “Long-term bone and lung consequences associated with hospital-acquired severe acute respiratory syndrome: a 15-year follow-up from a prospective cohort study.” Bone Res 8: 8. https://doi.org/10.1038/s41413-020-0084-5.